iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 7
1

回顧一 下,Learned Index建置Model,學習資料的CDF分布,預測出位置。

但是,有一個問題是對於Model來說,預測出的位置可能會有錯誤,也就是所謂的預測誤差,那怎麼辦呢? 這樣不就找不到資料ㄇ....

Kraska et al. 對於不精準的問題,提出一個方法,每當Model訓練完後,

針對Model預測出來的位置與真實的位置進行誤差的計算,計算Model預測位置 大於真實位置 與 小於真實位置 的最大誤差

  • 我們在這裡定義幾個參數:
    • real_pos : 真實的位置
    • pos : Model 的預測位置
    • min_err : 小於pos的最大誤差
      • pos < real_pos,max( |pos - real_pos| )
    • max_err : 大於pos的最大誤差
      • pos > real_pos,max( |pos - real_pos| )
    • binary search 範圍: [ pos - min_err, pos + max_err ],就算預測位置錯誤,依舊能在最大誤差範圍內找到資料。

使得Model查詢可以在 pos - min_errpos + max_err 進行 binary search。

換句話說,即便Model預測不準,一樣能在一定的範圍內查找到資料 ~

https://ithelp.ithome.com.tw/upload/images/20200922/20129198HKXHhlpg9N.png


上一篇
Day 6 - 建置Model學習CDF分布
下一篇
Day 8 - 初步測試
系列文
索引結構與機器學習的相遇30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言